Choix d'une mesure de proximité discriminante dans un contexte topologique

نویسندگان

  • Fatima Zahra Aazi
  • Rafik Abdesselam
چکیده

Résumé. Les résultats de toute opération de classification ou de classement d’objets dépendent fortement de la mesure de proximité choisie. L’utilisateur est amené à choisir une mesure parmi les nombreuses mesures de proximité existantes. Or, selon la notion d’équivalence topologique choisie, certaines sont plus ou moins équivalentes. Dans cet article, nous proposons une nouvelle approche de comparaison et de classement de mesures de proximité, dans une structure topologique et dans un objectif de discrimination. Le concept d’équivalence topologique fait appel à la structure de voisinage local. Nous proposons alors de définir l’équivalence topologique entre deux mesures de proximité à travers la structure topologique induite par chaque mesure dans un contexte de discrimination. Nous proposons également un critère pour choisir la "meilleure" mesure adaptée aux données considérées, parmi quelques mesures de proximité les plus utilisées dans le cadre de données quantitatives. Le choix de la "meilleure" mesure de proximité discriminante peut être vérifié a posteriori par une méthode d’apprentissage supervisée de type SVM, analyse discriminante ou encore régression Logistique, appliquée dans un contexte topologique. Le principe de l’approche proposée est illustré à partir d’un exemple de données quantitatives réelles avec huit mesures de proximité classiques de la littérature. Des expérimentations ont permis d’évaluer la performance de cette approche topologique de discrimination en terme de taille et/ou de dimension des données considérées et de sélection de la "meilleur" mesure de proximité discriminante.

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Sélection topologique de variables dans un contexte de discrimination

Résumé. En apprentissage automatique, la présence d’un grand nombre de variables explicatives conduit à une plus grande complexité des algorithmes et à une forte dégradation des performances des modèles de prédiction. Pour cela, une sélection d’un sous-ensemble optimal discriminant de ces variables s’avère nécessaire. Dans cet article, une approche topologique est proposée pour la sélection de ...

متن کامل

Equivalence topologique entre mesures de proximité

Résumé. Le choix d’une mesure de proximité entre objets a un impact direct sur les résultats de toute opération de classification, de comparaison, d’évaluation ou de structuration d’un ensemble d’objets. Pour un problème donné, l’utilisateur est amené à choisir une parmi les nombreuses mesures de proximité existantes. Or, selon la notion d’équivalence choisie, comme celle basée sur les préordon...

متن کامل

SEMIOSEM : une mesure de similarité conceptuelle fondée sur une approche sémiotique

Cet article propose une nouvelle mesure de similarité conceptuelle baptisée SEMIOSEM (Semiotic-Based Similarity Measure). La première originalité de cette mesure est de prendre en compte les trois dimensions sémiotiques de la conceptualisation sous-jacente à une ontologie de domaine : l’intension (i.e. les propriétés utilisées pour définir les concepts et la structure de la hiérarchie de subsom...

متن کامل

CRIM: un module de corrélation d'alertes et de réaction aux attaques

Avec le besoin grandissant de protéger les systèmes d’informations, la détection d’intrusion constitue une démarche intéressante mais encore très imparfaite. Il y a actuellement deux approches principales de la détection d’intrusions : l’approche comportementale et l’approche par détection de scénarios. Aucune de ces approches n’est complètement satisfaisante. Elles génèrent souvent de trop nom...

متن کامل

Sous-bases k-faibles pour des règles d'association valides au sens de la confiance

L’un des problèmes majeurs rencontrés dans la fouille des règles d’association valides au sens de la confiance est le nombre souvent très élevé de ces règles. Plusieurs solutions à ce problème ont été proposées ou considérées dans la littérature. Parmi ces solutions figurent les bases, c’est-à-dire, des familles génératrices minimales (Zaki et Ogihara, 1998; Pasquier et al., 1999). La plupart d...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2015